Optimización Convexa: Fundamentos Geométricos de la Optimización Convexa

Imagina navegar un paisaje complejo donde tu objetivo es encontrar el punto más cercano a la seguridad. En el lenguaje de la optimización, esta 'seguridad' es un conjunto $C$, y el acto de encontrar el punto más cercano es una proyección. Aunque la intuición sugiere que siempre existe un único punto 'más cercano', la realidad matemática es más matizada. La base geométrica de la optimización convexa se asienta en formalizar la 'proximidad', avanzando más allá de la intuición euclidiana hacia representaciones funcionales rigurosas como las funciones indicadora y de soporte.

1. Proyecciones y Distancias

La distancia desde un punto $x_0$ hasta un conjunto $C$ se define como el ínfimo de todas las distancias posibles a puntos dentro del conjunto:

$\text{dist}(x_0, C) = \inf\{\|x_0 - x\| \mid x \in C\}$

El optimizador específico que alcanza esta distancia es el operador de proyección:

$P_C(x_0) = \text{argmin}\{\|x - x_0\| \mid x \in C\}$

Para un plano simple definido por $a^T x = b$, la proyección tiene una hermosa solución en forma cerrada: $P_C(x_0) = x_0 + (b - a^T x_0)a/\|a\|_2^2$. Sin embargo, para conjuntos generales, este problema sigue siendo una optimización con restricciones: minimizar $\|x - x_0\|$ sujeto a $f_i(x) \leq 0$ y $Ax = b$.

2. Geometría Funcional

Para tratar las restricciones geométricas como componentes objetivos, empleamos dos potentes 'espejos' funcionales:

La Función Indicadora $I_C(x)$: $I_C(x) = \begin{cases} 0 & x \in C \\ +\infty & x \notin C \end{cases}$. Esto reduce la geometría a una penalización numérica.
La Función de Soporte $S_C(x)$: $S_C(x) = \sup_{y \in C} x^T y$. Esto caracteriza el conjunto mediante sus hiperplanos de frontera en todas las direcciones.

Teorema: Teorema de Motzkin

Un conjunto no vacío y cerrado $C \in \mathbf{R}^n$ es un conjunto de Chebyshev (que posee una proyección única para cada $x_0$) si y solo si es convexo.

Esquema de Prueba (Unicidad)

Supongamos que $C$ es convexo y la norma es estrictamente convexa. Si hubiera dos puntos distintos más cercanos $u, v \in C$ con $\|u - x_0\| = \|v - x_0\| = d$, entonces su punto medio $w = (u+v)/2$ estaría en $C$ (por convexidad).

Por la convexidad estricta de la norma: $\|w - x_0\| = \|\frac{1}{2}(u - x_0) + \frac{1}{2}(v - x_0)\| < \frac{1}{2}\|u - x_0\| + \frac{1}{2}\|v - x_0\| = d$.

Esto contradice la suposición de que $d$ era la distancia mínima. Por tanto, la proyección debe ser única.

Advertencia 8.4: Dependencia de la Norma

A menudo construimos un hiperplano separador usando: $(P_C(x_0) - x_0)^T (x - (1/2)(x_0 + P_C(x_0))) = 0$. ¡Cuidado! Esta construcción específica es válida solo para la norma euclidiana. Las normas generales requieren tratamientos más sutiles de la ortogonalidad.

🎯 Insight Fundamental

La convexidad es el 'pegamento' que garantiza la estabilidad en la optimización geométrica. Sin ella, incluso la tarea sencilla de 'encontrar el punto más cercano' puede dar lugar a múltiples soluciones contradictorias, provocando inestabilidad algorítmica.

PREGUNTA 1

Según el Teorema de Motzkin, ¿cuáles son las condiciones necesarias y suficientes para que un conjunto no vacío y cerrado en Rⁿ sea un conjunto de Chebyshev?

Debe ser acotado y abierto.

Debe ser convexo.

Debe contener el origen.

Debe ser un subespacio.

PREGUNTA 2

¿Cuál es la solución en forma cerrada para proyectar un punto x₀ sobre el plano aᵀx = b en el espacio euclidiano?

P_C(x₀) = x₀ + (b - aᵀx₀)a / ||a||₂²

P_C(x₀) = x₀ - (b + aᵀx₀)a / ||a||₂

P_C(x₀) = (b / aᵀx₀)a

P_C(x₀) = x₀ + aᵀx₀ / b

PREGUNTA 3

¿Por qué la proyección sobre el conjunto de matrices de rango-k (Ejemplo 8.2) podría carecer de unicidad?

El conjunto no es convexo.

El conjunto no es cerrado.

El rango siempre es una propiedad lineal.

Las matrices no tienen normas.

PREGUNTA 4

¿Qué función nos permite representar un conjunto C como una penalización en una función objetivo, devolviendo 0 si el punto está en el conjunto y ∞ en caso contrario?

La Función de Soporte S_C(x)

La Función Indicadora I_C(x)

La Función de Distancia dist(x, C)

La Matriz de Gram

PREGUNTA 5

Verdadero o Falso: la construcción de un hiperplano separador usando el punto medio entre x₀ y su proyección funciona para cualquier norma.

Verdadero

Falso